****************************************************************************************************************************
Date: 26 JAN 2015

Purpose: Drop old parental controls and add new

****************************************************************************************************************************;


libname in 'K:\Data\Workdata\702727\xru\NICU project\Datasæt';

*Henter først min sibling sample med regions information;
data nicu_maternity;
set in.nicu_maternity;

drop
basic_edu_mom hsvoc_edu_mom college_mom basic_edu_dad hsvoc_edu_dad college_dad 
income_mom income_dad total_income 
employed_dad employed_mom immigrant_mom immigrant_dad
employed_mom10y employed_mom5y employed_dad10y employed_dad5y 
mom_educ_mis dad_educ_mis age_mom_mis age_dad_mis
age_mom age_dad age_fb_mom age_fb_dad 
;

birthyear_minus1=birthyear-1;
run;


proc sort data=nicu_maternity;
by pnr;
run;


*******************************************************************************************
Adding parental:
Education
Employment
Income
******************************************************************************************;


*Forældres uddannelse;

*Henter variabel for højeste fuldførte uddannelse;
libname in 'F:\Rawdata\702727';

*Laver makro;
*udda2007 indeholder ikke variablen hffsp, så benytter kun data til og med 2006;

%macro uddannelse(start,slut);
%do i=&start %to &slut;

data uddannelse&i;
set in.udda&i;

year=&i;

%end; 
%mend;
%uddannelse(1980,2001);


*Sætter datasættene sammen til et samlet uddannelses datasæt;
data uddannelse;
set uddannelse1980 uddannelse1981 uddannelse1982 uddannelse1983 uddannelse1984 uddannelse1985 uddannelse1986 uddannelse1987 uddannelse1988
uddannelse1989 uddannelse1990 uddannelse1991 uddannelse1992 uddannelse1993 uddannelse1994 uddannelse1995 uddannelse1996 uddannelse1997
uddannelse1998 uddannelse1999 uddannelse2000 uddannelse2001;
run;

proc datasets;
delete uddannelse1980-uddannelse2001;
quit; 

*************************************************************************************
Grupperer uddannelser og laver dummies for forældrenes højest fuldførte uddannelse.
Benytter substring til kun at fokusere på de to første cifre i HFFSP
*************************************************************************************;

DATA uddannelse;
Set uddannelse;

prim_edu=0;
hs_edu=0;
voc_edu=0;
kvu=0;
mvu=0;
lvu=0;

i=substr(hffsp,1,2);
if i ='10' then prim_edu=1;
else if '20' le i lt '30' then hs_edu=1;
else if '30' le i lt '39' then voc_edu=1;
else if '40' le i lt '50' then kvu=1;
else if '50' le i lt '60' then mvu=1;
else if '60' le i le '70' then lvu=1;

If hffsp=('') then prim_edu=".";
If hffsp=('') then hs_edu=".";
If hffsp=('') then voc_edu=".";
If hffsp=('') then kvu=".";
If hffsp=('') then mvu=".";
If hffsp=('') then lvu=".";

If hffsp=. then prim_edu=".";
If hffsp=. then hs_edu=".";
If hffsp=. then voc_edu=".";
If hffsp=. then kvu=".";
If hffsp=. then mvu=".";
If hffsp=. then lvu=".";

run;	

proc freq data=uddannelse;
table i;
run;


****************************************************
Tilføjer uddannelses længden - Antal års uddannelse
	(kode fra Rune Vejlin)
***************************************************;
data udd_length;
set uddannelse;

/*
if aar-alder<1959 then elen=7; 		*Primary education prior to 1959;
if aar-alder>=1959 then elen=9; 	*Primary education after 1959;
*/

if i='10' then elen=9;					*Primary education;
if i='20' then elen=12;					*Highschool;
if i='25' then elen=12;					*Highschool;
if i='30' then elen=10;					*Introductory part of voccational education;
if i='35' then elen=12;					*Voccational education;
if i='40' then elen=14;					*Short further education;
if i='50' then elen=16;					*Medium length further education;
if i='60' then elen=15;					*Bachelor degree;
if i='65' then elen=18;					*Master-degree;
if i='70' then elen=20;					*PhD degree;
if i='90' then elen=.;					*Unknown educations have missing length;
run;

proc freq data=udd_length;
table prim_edu hs_edu voc_edu kvu mvu lvu elen;
run;

*Gemmer kun de variable jeg skal bruge videre;
data udd_length1;
set udd_length;
keep
pnr year prim_edu hs_edu voc_edu kvu mvu lvu elen;
run;



*Kobler moderens højeste fuldførte uddannelse i det år barnet er født på det samlede datasæt 'samlet_perinatal';
*Omdøber pnr til pnrm og year til fødselsår. Herved kan jeg merge moderens uddannelse det år barnet er født på;

DATA udd_length1_mor;
set udd_length1;

rename
pnr=pnrm 
year=birthyear
prim_edu=M_prim_edu
hs_edu=M_hs_edu
voc_edu=M_voc_edu
kvu=M_kvu
mvu=M_mvu
lvu=M_lvu
elen=mom_elen
;
run;

proc sort data=udd_length1_mor;
by pnrm birthyear;
run;

proc sort data=nicu_maternity;
by pnrm birthyear;
run;


Data samlet_udd_mor;
merge nicu_maternity (in=a) udd_length1_mor;
by pnrm birthyear;
if a;
run;

proc print data=samlet_udd_mor (obs=2000);
var pnr pnrm pnrf birthyear M_prim_edu M_hs_edu M_voc_edu M_kvu M_mvu M_lvu mom_elen;
run;


*Kobler faderens højeste fuldførte uddannelse i det år barnet er født på det samlede datasæt 'samlet_perinatal';
*Omdøber pnr til pnrf og year til fødselsår. Herved kan jeg merge moderens uddannelse det år barnet er født på;

DATA uddannelse_far;
set udd_length1;
rename
pnr=pnrf
year=birthyear
prim_edu=F_prim_edu
hs_edu=F_hs_edu
voc_edu=F_voc_edu
kvu=F_kvu
mvu=F_mvu
lvu=F_lvu
elen=dad_elen
;

run;

proc sort data=uddannelse_far;
by pnrf birthyear;
run;

proc sort data=samlet_udd_mor;
by pnrf birthyear;
run;


Data samlet_uddannelse;
merge samlet_udd_mor (in=a) uddannelse_far;
by pnrf birthyear;
if a;
run;



Data samlet_uddannelse;
set samlet_uddannelse;

if mom_elen=. then M_education_mis=1;
else M_education_mis=0;

if dad_elen=. then F_education_mis=1;
else F_education_mis=0;

if M_prim_edu=. then M_prim_edu=0;
if M_hs_edu=. then M_hs_edu=0;
if M_voc_edu=. then M_voc_edu=0;
if M_kvu=. then M_kvu=0;
if M_mvu=. then M_mvu=0;
if M_lvu=. then M_lvu=0;
if F_prim_edu=. then F_prim_edu=0;
if F_hs_edu=. then F_hs_edu=0;
if F_voc_edu=. then F_voc_edu=0;
if F_kvu=. then F_kvu=0;
if F_mvu=. then F_mvu=0;
if F_lvu=. then F_lvu=0;
run;


*Alternativ opdeling af mors uddannelse;
data samlet_uddannelse;
set samlet_uddannelse;

mom_Basic=0;
if M_prim_edu=1 then mom_basic=1;

mom_hsvoc=0;
if M_hs_edu=1 or M_voc_edu=1 then mom_hsvoc=1;

mom_college=0;
if M_kvu=1 or M_mvu=1 or M_lvu=1 then mom_college=1;


drop m_prim_edu m_hs_edu m_voc_edu m_kvu m_mvu m_lvu;
run;

proc freq data=samlet_uddannelse;
table mom_Basic mom_hsvoc mom_college M_education_mis mom_elen;
run;


*Alternativ opdeling af fars uddannelse;
data samlet_uddannelse;
set samlet_uddannelse;

dad_Basic=0;
if F_prim_edu=1 then dad_basic=1;

dad_hsvoc=0;
if F_hs_edu=1 or F_voc_edu=1 then dad_hsvoc=1;

dad_college=0;
if F_kvu=1 or F_mvu=1 or F_lvu=1 then dad_college=1;


drop f_prim_edu f_hs_edu f_voc_edu f_kvu f_mvu f_lvu ;
run;

proc freq data=samlet_uddannelse;
table dad_Basic dad_hsvoc dad_college F_education_mis dad_elen;
run;


*_____________Forældrenes alder ved barnets fødsel_______________; 

*Henter forældrenes fødselsdato 
(henter samtidig årsledighedsgrad, benyttes ikke her. I Anettes program 'Alder_uddannelse' benyttes den til at danne forældres årsledighed);
*Da der ikke for alle forældre er persondata hvert år, tager jeg alle år med for at øge sandsynligheden for
at forældrene er registreret;


libname in 'F:\Rawdata\702727';

*Laver makro der henter alle datasæt ind;

%macro persondata(start,slut);
%do i=&start %to &slut;

data persondata&i;
set in.persondata&i(keep=pnr fodtdato arledgr LONIND);

year=&i;

%end; 
%mend;
%persondata(1980,2001);
run;

data persondata;
set persondata1980 persondata1981 persondata1982 persondata1983 persondata1984 persondata1985 persondata1986 persondata1987 persondata1988
persondata1989 persondata1990 persondata1991 persondata1992 persondata1993 persondata1994 persondata1995 persondata1996 persondata1997 
persondata1998 persondata1999 persondata2000 persondata2001;
run;


*Bestemmer forældrens fødselsår;

data alder;
set persondata(keep=pnr fodtdato);
fodselsaar=year(fodtdato);
run;

*I forhold til alder skal vi kun have én observation pr. pnr;

proc sort data=alder;
by pnr;
run;

data alder;
set alder;
by pnr;
if first.pnr;
run;


*Tilføjer moderens alder til det samlede datasæt;

data alder_mor;
set alder;

rename
pnr=pnrm
fodselsaar=mom_birthyear
fodtdato=mom_birthdate;
run;

proc sort data=alder_mor;
by pnrm;
run;

proc sort data=samlet_uddannelse;
by pnrm;
run;

data samlet_alder_mor;
merge samlet_uddannelse (in=a) alder_mor;
by pnrm;
if a;
run;


*Tilføjer faderens alder til det samlede datasæt;

data alder_far;
set alder;

rename
pnr=pnrf 
fodselsaar=dad_birthyear
fodtdato=dad_birthdate;
run;

proc sort data=alder_far;
by pnrf;
run;

proc sort data=samlet_alder_mor;
by pnrf;
run;

data samlet_alder;
merge samlet_alder_mor (in=a) alder_far;
by pnrf;
if a;
run;


*Beregner forældrenes alder ved første barnets fødsel;

data samlet_alder;
set samlet_alder;

mom_age_fb=birthyear_fb-mom_birthyear;
dad_age_fb=birthyear_fb-dad_birthyear;

mom_age=birthyear-mom_birthyear;
dad_age=birthyear-dad_birthyear;

run;




*************************************
Imputer uddannelses længe med median
************************************;

data samlet_alder_impute;
set samlet_alder;
if birthyear<1980 then delete;
run;

*Mor;
proc sort data=samlet_alder_impute;
by mom_birthyear;
run;

proc freq data=samlet_alder_impute;
table mom_birthyear;
run;

proc means data=samlet_alder_impute Median NWAY NOPRINT;
class mom_birthyear;
var mom_elen;
Output Out=temp_momelen median=median_momelen;
run;

*Merger mom_elen median på alle mødre ud fra mom birthyear;

proc sort data=temp_momelen (drop=_TYPE_ _FREQ_);
by mom_birthyear;
run;
proc sort data=samlet_alder_impute;
by mom_birthyear;
run;

data impute_mor;
merge samlet_alder_impute (in=a) temp_momelen;
by mom_birthyear;
if a;
run;


*Far;
proc sort data=samlet_alder_impute;
by dad_birthyear;
run;

proc freq data=samlet_alder_impute;
table dad_birthyear;
run;

proc means data=samlet_alder_impute Median NWAY NOPRINT;
class dad_birthyear;
var dad_elen;
Output Out=temp_dadelen median=median_dadelen;
run;

*Merger mom_elen median på alle mødre ud fra mom birthyear;

proc sort data=temp_dadelen (drop=_TYPE_ _FREQ_);
by dad_birthyear;
run;
proc sort data=impute_mor;
by dad_birthyear;
run;

data impute_far;
merge impute_mor (in=b) temp_dadelen;
by dad_birthyear;
if b;
run;

data samlet_impute;
set impute_far;

mom_elen_impute=mom_elen;
if mom_elen=. then mom_elen_impute=median_momelen;

dad_elen_impute=dad_elen;
if dad_elen=. then dad_elen_impute=median_dadelen;
run;

proc sort data=samlet_impute;
by pnrm birthyear;
run;

proc means data=samlet_impute;
var mom_birthyear mom_elen mom_elen_impute dad_birthyear dad_elen dad_elen_impute;
run;

*Sætter sammen med fuld data;
proc sort data=samlet_alder;
by pnr;
run;

data samlet_impute1;
set samlet_impute;
drop median_momelen median_dadelen;
proc sort;
by pnr;
run;


data samlet_alder1;
merge samlet_alder (in=a) samlet_impute1;
by pnr;
if a;
run;



*_____________Forældrenes beskæftigelsesstatus_______________; 



libname in 'F:\Rawdata\702727\data200809';

*Laver makro der henter alle indkomstdatasæt fra 90 til 01;

%macro indkomstdata1(start,slut);
%do i=&start %to &slut;

data indkomstdata&i;
set in.indkomst&i(keep=pnr BESKST /*BESKST02*/ QBRUKOR);

year=&i;

run;

%end; 
%mend;
%indkomstdata1(1980,2004);

*Samler indkomst data for de forskellige år;

data indkomstdata;
set indkomstdata1980 indkomstdata1981 indkomstdata1982 indkomstdata1983 indkomstdata1984 indkomstdata1985 indkomstdata1986 indkomstdata1987
indkomstdata1988 indkomstdata1989 indkomstdata1990 indkomstdata1991 indkomstdata1992 indkomstdata1993 indkomstdata1994 indkomstdata1995 
indkomstdata1996 indkomstdata1997 indkomstdata1998 indkomstdata1999 indkomstdata2000 indkomstdata2001 indkomstdata2002 indkomstdata2003 indkomstdata2004; 
run;


*Beskæftigelsesdata;
data besk_status;
set indkomstdata(keep=pnr BESKST /*BESKST02*/ year);
if BESKST=('') then BESKST=".";

/*if BESKST02=('') then BESKST02=".";*/

run;


*Dummies for beskæftigelsestilstand;

data besk_status;
set besk_status;


if BESKST in(1,2,3,4) then employed=1;
if BESKST in(5,6,7,8) then employed=0;

run;



*Tilføjer moderens beskæftigelsesstatus året før barnet bliver født til det samlede datasæt;

data besk_status_mor;
set besk_status;
rename
pnr=pnrm 
employed=M_employed
year=birthyear_minus1;

label M_employed="Mor employed";

run;

*Merger mors beskæftigelses info i året før barn er født på det samlede data.
Sorterer først efter pnrm og fødselsår;

proc sort data=samlet_alder1;
by pnrm birthyear_minus1;
run;

proc sort data=besk_status_mor;
by pnrm birthyear_minus1;
run;

data samlet_besk_mor;
merge samlet_alder1 (in=a) besk_status_mor;
by pnrm birthyear_minus1;
if a;
run;



*Tilføjer faderens beskæftigelsesstatus året før barnet bliver født til det samlede datasæt;

data besk_status_far;
set besk_status; 

rename
pnr=pnrf
employed=F_employed
year=birthyear_minus1; 

label F_employed="Far employed";

run;

*Merger fars beskæftigelses info i det år barnet er født på det samlede data.
Sorterer først efter pnrm og fødselsår;

proc sort data=samlet_besk_mor;
by pnrf birthyear_minus1;
run;

proc sort data=besk_status_far;
by pnrf birthyear_minus1;
run;

data samlet_besk;
merge samlet_besk_mor (in=a) besk_status_far;
by pnrf birthyear_minus1;
if a;
run;

data samlet_besk;
set samlet_besk;
drop BESKST;
run;

data samlet_besk;
set samlet_besk;

if M_employed=. then M_employed_mis=1;
else M_employed_mis=0;
if M_employed=. then M_employed=0;

if F_employed=. then F_employed_mis=1;
else F_employed_mis=0;
if F_employed=. then F_employed=0;
run;



*_____________Forældrenes indkomst_______________; 


*Ændre indkomst til faste priser. 
Ganger indkomsten hvert år med indekset fra begyndelsesåret og dividerer med prisindekset i det pågældende år
Anvender forbrugerprisindekset fra Danmarks Statistiks hjemmeside. 2004 sættes som begyndelsesår;


data indkomst;
set persondata(keep=pnr lonind year);
run;

data indkomst;
set indkomst;
	IF year = 1980 THEN indkomst2004 = lonind*(108.3/45.6);
	IF year = 1981 THEN indkomst2004 = lonind*(108.3/51.0);
	IF year = 1982 THEN indkomst2004 = lonind*(108.3/56.1);
	IF year = 1983 THEN indkomst2004 = lonind*(108.3/60.0);
	IF year = 1984 THEN indkomst2004 = lonind*(108.3/63.8);
	IF year = 1985 THEN indkomst2004 = lonind*(108.3/66.7);
	IF year = 1986 THEN indkomst2004 = lonind*(108.3/69.2);
	IF year = 1987 THEN indkomst2004 = lonind*(108.3/72.0);
	IF year = 1988 THEN indkomst2004 = lonind*(108.3/75.3);
	IF year = 1989 THEN indkomst2004 = lonind*(108.3/78.9);
	IF year = 1990 THEN indkomst2004 = lonind*(108.3/80.9);
	IF year = 1991 THEN indkomst2004 = lonind*(108.3/82.9);
	IF year = 1992 THEN indkomst2004 = lonind*(108.3/84.6);
	IF year = 1993 THEN indkomst2004 = lonind*(108.3/85.7);
	IF year = 1994 THEN indkomst2004 = lonind*(108.3/87.4);
	IF year = 1995 THEN indkomst2004 = lonind*(108.3/89.2);
	IF year = 1996 THEN indkomst2004 = lonind*(108.3/91.1);
	IF year = 1997 THEN indkomst2004 = lonind*(108.3/93.1);
	IF year = 1998 THEN indkomst2004 = lonind*(108.3/94.8);
	IF year = 1999 THEN indkomst2004 = lonind*(108.3/97.2);
	IF year = 2000 THEN indkomst2004 = lonind*(108.3/100);
	IF year = 2001 THEN indkomst2004 = lonind*(108.3/102.4);
	IF year = 2002 THEN indkomst2004 = lonind*(108.3/104.8);
	IF year = 2003 THEN indkomst2004 = lonind*(108.3/107.0);
	IF year = 2004 THEN indkomst2004 = lonind*(108.3/108.3);

run;

*Tilføjer moderens indkomst året før barnet bliver født;

data indkomst_mor;
set indkomst;

rename
pnr=pnrm 
year=birthyear_minus1
indkomst2004=M_income2004  ;


label M_income2004= "Mom income";

run;

proc sort data=samlet_besk;
by pnrm birthyear_minus1;
run;

proc sort data=indkomst_mor;
by pnrm birthyear_minus1;
run;

data samlet_indk_mor;
merge samlet_besk (in=a) indkomst_mor;
by pnrm birthyear_minus1;
if a;
run;

*Tilføjer faderens bruttoindkomst året før barnet bliver født;

data indkomst_far;
set indkomst (drop=lonind);

rename
pnr=pnrf 
year=birthyear_minus1 
indkomst2004=F_income2004;

label F_income2004= "Dad income";

run;

proc sort data=samlet_indk_mor;
by pnrf birthyear_minus1;
run;

proc sort data=indkomst_far;
by pnrf birthyear_minus1;
run;

data samlet_indkomst;
merge samlet_indk_mor (in=a) indkomst_far;
by pnrf birthyear_minus1;
if a;
run;


*Sorterer efter barnets pnr;
proc sort data=samlet_indkomst;
by pnr;
run;


*Laver først en variabel der indikere om indkomst er missing. Gøres inden jeg imputer;
data samlet_indkomst;
set samlet_indkomst;

if M_income2004=. then M_income_mis=1;
else M_income_mis=0;

if F_income2004=. then F_income_mis=1;
else F_income_mis=0;
run;

proc freq data=samlet_indkomst;
table M_income_mis F_income_mis;
run; 


*Hvis bruttoindkomsten er negativ sættes den til nul;

data samlet_indkomst1;
set samlet_indkomst;

M_income=M_income2004;
F_income=F_income2004;

if M_income2004<0 and M_income2004^=. then M_income=0;
if F_income2004<0 and F_income2004^=. then F_income=0; 

run;


*Hvis bruttoindkomsten er missing sættes den (i første omgang) lig sample mean;

proc sql; 
create table samlet_indkomst1_impute as select *,
mean (M_income) as mean_M_income
from samlet_indkomst1;
quit;
run;

proc sql; 
create table samlet_indkomst1_impute1 as select *,
mean (F_income) as mean_F_income
from samlet_indkomst1_impute;
quit;
run;

data samlet_indkomst2;
set samlet_indkomst1_impute1;

if M_income=. then M_income=mean_M_income;
if F_income=. then F_income=mean_F_income;
run; 

*Samler mor og fars indkomst i fødselsår til et samlet indkomst mål.;
data samlet_indkomst2;
set samlet_indkomst2;

total_income=M_income+F_income;

run;










****************************************************************************************************************'
										Tilføjer indvandrerstatus
******************************************************************************************************************;
libname in 'F:\Rawdata\702727\data201006';

*Laver en makro der indlæser data;

%macro indvandrer(start,slut);
%do i=&start %to &slut;

data indvandrer&i;
set in.iepe&i;

year=&i;

%end; 
%mend;
%indvandrer(1980,2008);

data indvandrer;
set
indvandrer1980 indvandrer1981 indvandrer1982 indvandrer1983 indvandrer1984 indvandrer1985 indvandrer1986 indvandrer1987 indvandrer1988 indvandrer1989 
indvandrer1990 indvandrer1991 indvandrer1992 indvandrer1993 indvandrer1994 indvandrer1995 indvandrer1996 indvandrer1997 
indvandrer1998 indvandrer1999 indvandrer2000 indvandrer2001 indvandrer2002 indvandrer2003 indvandrer2004 indvandrer2005 
indvandrer2006 indvandrer2007 indvandrer2008;
run;

proc sort data=indvandrer;
by pnr;
run;

*Gemmer kun én observation per pnr;
*Disse variable skulle gerne være ens over årene;
data indvandrer;
set indvandrer;
by pnr;
if first.pnr;
run;

*Laver datasæt for moderen;
data indvandrer_mor;
set indvandrer(rename=(pnr=pnrm));
run;


proc sort data=samlet_indkomst2;
by pnrm ;
run;

*Merger moderens indvandrer data på andet data;
data samlet_indvandrer_mor;
merge samlet_indkomst2 (in=a) indvandrer_mor;
if a;
by pnrm ;
run;

*Gør indvandre variablen specifik for moderen, og droper variable jeg ikke skal bruge;
data samlet_indvandrer_mor1;
set samlet_indvandrer_mor(rename=(IETYPE=m_IETYPE));
drop IELAND IELANDG1 IELANDG2 year;
label m_IETYPE="Mor dansk/indvandrere";
run;

*Angiver en variable for  indvandrer-status. 
Hvis dansk lig 0 og hvis indvandrer eller efterkommer af indvandrer lig 1;

data samlet_indvandrer_mor1;
set samlet_indvandrer_mor1;
if m_IETYPE="1" then mom_immigrant=0;
if m_IETYPE in ("2","3") then mom_immigrant=1;
run;

*Gør tilsvarende for faren;
data indvandrer_far;
set indvandrer(rename=(pnr=pnrf));
run;

proc sort data=samlet_indvandrer_mor1;
by pnrf ;
run;

*Merger faderens indvandrer data på andet data;
data samlet_indvandrer;
merge samlet_indvandrer_mor1 (in=a) indvandrer_far;
if a;
by pnrf ;
run;

data samlet_indvandrer;
set samlet_indvandrer(rename=(IETYPE=f_IETYPE));
drop IELAND IELANDG1 IELANDG2;
label f_IETYPE=" Far dansk/indvandrere";
run;

*Angiver en variable for  indvandrer-status. 
Hvis dansk lig 0 og hvis indvandrer eller efterkommer af indvandrer lig 1;

data samlet_indvandrer;
set samlet_indvandrer;
if f_IETYPE="1" then dad_immigrant=0;
if f_IETYPE in ("2","3") then dad_immigrant=1;
run;

proc sort data=samlet_indvandrer;
by pnr;
run;


*Dropper de variable jeg ikke skal bruge;
data Samlet_alt;
set samlet_indvandrer (drop =  LONIND m_IETYPE f_IETYPE year);
run;
 

data samlet_alt;
set samlet_alt;

if mom_immigrant=. then mom_immigrant=0;
if dad_immigrant=. then dad_immigrant=0;

if pnrf=. then dad_missing=1;
else dad_missing=0;
run;




data samlet_alt1;
set samlet_alt (drop= birthyear_minus1 M_income2004 F_income2004 mean_M_income mean_F_income);
proc sort;
by pnrm birthyear;
run;


*Gemmer i nyt datasæt;
libname out 'K:\Data\Workdata\702727\xru\NICU project\Datasæt';

data out.nicu_controls;
set Samlet_alt1;
run;

